✅【推しの子】 のようなタイトルで検索結果がバグる
検索クエリを作成するときに【コミック版】みたいな情報は除去しているため
replace(/【.*】/g, "")
「【最新刊】【推しの子】 7」は7で検索をかけてしまう
なぜこうしているか
「【コミック版】A」というタイトルだった時、「【コミック版】」を消して検索したいため
Aを持っていても「【コミック版】 A」を検索する。ScrapboxはAND検索なので検索がヒットせず、持っていない扱いになってしまう どうするか
方針
(採用案)「【」つきのタイトルをホワイトリストにする
ほとんど見かけない
replace(/【(?!推しの子).*?】/g, "") してる
最後に?をつけることで【最新刊】【推しの子】などの括弧を個別に扱えるようにしている
ないと先頭の【と末尾の】までがマッチしてしまう
除外タイトルを追加したい場合replace(/【(?!(推しの子|追加).*?】/g, "") とすればいい
【コミック版】のような削除する情報をブラックリストにする
何があるんだろうか?
タイトルにそのようなものが入らないところからタイトルを取る
h1とかだとこういうのが入るが
詳細な作品情報の欄には基本的に入らない
ただ、これがないサイトもあるので統一的に保証はできない
先頭の1つだけを除去する設定にして様子を見る?
だめ。「【推しの子】」だった場合に検索ができない